W artykule przedstawiono podstawy metodologii imputacyjnej (w tym metodologii wielokrotnej imputacji), koncentrując się na wyjaśnieniu matematycznej strony zagadnień. Analizowano sytuację, gdy obserwacje tworzące pierwotną próbkę są niezależnymi zmiennymi losowymi o jednakowym rozkładzie, a braki odpowiedzi pojawiają się losowo w sposób niezależny od obserwacji. W szczególności wskazano na problemy pojawiające się, gdy w imputacji wielokrotnej stosowany jest standardowy estymator Rubina wariancji estymatora wielokrotnej imputacji i wskazano na możliwe ulepszenie tego popularnego estymatora. Punktem wyjścia analiz jest sytuacja, gdy za pojawianie się braków odpowiedzi odpowiada mechanizm deterministyczny.
imputacja, imputacja wielokrotna, estymator imputacyjny, estymator Rubina, imputacja średnią, imputacja typu hot-deck, imputacja regresyjna
Andridge, R.R., Little, R.J.A. (2010). A review of hot deck imputation survey non-response. International Statistical Revue, vol. 78, no. 1, s. 40—64.
Carpenter, J.R., Kenward, M.G. (2013). Multiple Imputation and its Application. Wiley, Chichester. de Waal, T., Pannekoek, J., Scholtus, S. (2011). Handbook of Statistical Data Editing and Imputation. Wiley, New York.
Donders, A.R.T., van der Heijden, G.J.M.G., Stijnen, T., Moons, K.G.M. (2006). Review: a gentle introduction to imputation of missing values. Journal of Clinical Epidemiology, vol. 59, no. 10, s. 1087—1091.
Garson, G.D. (2012). Missing Values Analysis & Data Imputation. Statistical Associate Publishers, Asheboro.
Horton, N.J., Lipsitz, S.R. (2001). Multiple imputation in practice: comparison of software packages for regression models with missing data. American Statistician, vol. 55, no. 3, s. 244—254.
Little, R.J.A., Rubin, D.B. (2002). Statistical Analysis with Missing Data. Wiley, New York.
Marciniak, E., Wesołowski, J. (1999). Asymptotic Eulerian expansions for binomial and negative binomial reciprocals. Proceedings of The American Mathematical Society, vol. 127, s. 3329— 3338.
Misztal, M. (2012). Imputation of missing data using R package. Acta Universitatis Lodziensis, Folia Oeconomica, vol. 269, s. 131—144.
Norazian Ramli, M.N., Yahaya, A.S., Ramli, N.A., Yusof, N.F.F.M., Abdullah, M.M.A. (2013). Roles of imputation methods for filling the missing values: a review. Advances in Environmental Biology, vol. 7, no. 12, s. 3861—3869.
Rempała, G.A. (2004). Asymptotic factorial powers expansions for binomial and negative binomial reciprocals. Proceedings of The American Mathematical Society, vol. 32, no. 1, s. 261—272.
Rubin, D.B. (1987). Multiple Imputation for Nonresponse in Surveys. Wiley, New York.
van Buuren, S. (2012). Flexible Imputation of Missing Data. Chapman&Hall/CRC, London.
van Buuren, S., Groothuis-Oudshoorn, K. (2011). mice: multivariate imputation by chained equations in R. Journal of Statistical Software, vol. 45, no. 3, s. 1—67, http://www.jstatsoft.org/.
Schafer, J.L. (1997). Analysis of Incomplete Multivariate Data. Chapman and Hall, Boston.
Szabłowski, P.J., Wesołowski, J., Wieczorkowski, R. (1996). Estymacja w podpopulacjach. Wiadomości Statystyczne, nr 7, s. 1—13.